Skip to content

指定区域识字(自定义模型) - OcrEx

函数简介

识别绑定窗口指定区域内的文字,使用内置或已加载的 OCR 模型(PP-OCR NCNN 等)。x1、y1、x2、y2 传 0, 0, 0, 0 为窗口整个客户区。

接口名称

OcrEx

DLL 调用

long OcrEx(long ola, int x1, int y1, int x2, int y2, long modelHandle);

参数说明

参数名类型说明
ola长整数型OLAPlug 对象指针,由 CreateCOLAPlugInterFace 生成。
x1整数型区域左上角 X
y1整数型区域左上角 Y
x2整数型区域右下角 X
y2整数型区域右下角 Y
modelHandle长整数型模型句柄;内置 PP-OCR mobile 为 0,自定义包为 OcrLoadModel 返回值

示例

SDK 调用

cpp
#include "OLAPlugServer.h"

OLAPlugServer ola;
// 0,0,0,0 表示绑定窗口整个客户区
// 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
long modelHandle = ola.OcrLoadModel("models/ocr.olam", "your_password", 0);
if (modelHandle == 0) {
    // 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
}
string text = ola.OcrEx(0, 0, 0, 0, modelHandle);
// text 为识别到的文字,多行以换行分隔
csharp
using OLAPlug;

var ola = new OLAPlugServer();
// 0,0,0,0 表示绑定窗口整个客户区
// 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
long modelHandle = ola.OcrLoadModel("models/ocr.olam", "your_password", 0);
if (modelHandle == 0)
{
    // 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
}
string text = ola.OcrEx(0, 0, 0, 0, modelHandle);
// text 为识别到的文字,多行以换行分隔
python
from OLAPlugServer import OLAPlugServer

ola = OLAPlugServer()
# 0,0,0,0 表示绑定窗口整个客户区
# 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
modelHandle = ola.OcrLoadModel("models/ocr.olam", "your_password", 0)
if modelHandle == 0:
    # 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
    pass
text = ola.OcrEx(0, 0, 0, 0, modelHandle)
# text 为识别到的文字,多行以换行分隔
java
import com.olaplug.OLAPlugServer;

OLAPlugServer ola = new OLAPlugServer();
// 0,0,0,0 表示绑定窗口整个客户区
// 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
long modelHandle = ola.OcrLoadModel("models/ocr.olam", "your_password", 0);
if (modelHandle == 0) {
    // 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
}
String text = ola.OcrEx(0, 0, 0, 0, modelHandle);
// text 为识别到的文字,多行以换行分隔
cpp
var ola = com("OlaPlug.OlaSoft")
// 0,0,0,0 表示绑定窗口整个客户区
// 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
var modelHandle = ola.OcrLoadModel("models/ocr.olam", "your_password", 0)
if (modelHandle == 0) {
    // 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
}
var text = ola.OcrEx(0, 0, 0, 0, modelHandle)
// text 为识别到的文字,多行以换行分隔
vbscript
Set ola = CreateObject("OlaPlug.OlaSoft")
' 0,0,0,0 表示绑定窗口整个客户区
' 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
modelHandle = ola.OcrLoadModel("models/ocr.olam", "your_password", 0)
If modelHandle = 0 Then
    ' 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
End If
text = ola.OcrEx(0, 0, 0, 0, modelHandle)
' text 为识别到的文字,多行以换行分隔
text
.局部变量 ola, OLAPlug
ola.创建 ()
' 0,0,0,0 表示绑定窗口整个客户区
' 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
modelHandle = ola.OcrLoadModel(“models/ocr.olam“, “your_password“, 0)
.如果真 (modelHandle = 0)
    ' 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
.如果真结束
text = ola.OcrEx(0, 0, 0, 0, modelHandle)
' text 为识别到的文字,多行以换行分隔
aardio
import OLAPlugServer;
var ola = OLAPlugServer();
// 0,0,0,0 表示绑定窗口整个客户区
// 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
var modelHandle = ola.OcrLoadModel("models/ocr.olam", "your_password", 0);
if (modelHandle == 0) {
    // 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
}
var text = ola.OcrEx(0, 0, 0, 0, modelHandle);
// text 为识别到的文字,多行以换行分隔
text
变量 ola <类型 = OLAPlugServer>
ola = 新建 OLAPlugServer
// 0,0,0,0 表示绑定窗口整个客户区
// 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
长整数 modelHandle = ola.OcrLoadModel("models/ocr.olam", "your_password", 0)
if (modelHandle == 0) {
    // 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
}
文本型 text = ola.OcrEx(0, 0, 0, 0, modelHandle)
// text 为识别到的文字,多行以换行分隔
cpp
#include "OLAPlugServer.h"

OLAPlugServer ola;
// 0,0,0,0 表示绑定窗口整个客户区
// 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
long modelHandle = ola.OcrLoadModel("models/ocr.olam", "your_password", 0);
if (modelHandle == 0) {
    // 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
}
string text = ola.OcrEx(0, 0, 0, 0, modelHandle);
// text 为识别到的文字,多行以换行分隔

原生 DLL 调用

cpp
long instance = CreateCOLAPlugInterFace();
// 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
long modelHandle = OcrLoadModel(instance, "models/ocr.olam", "your_password", 0);
if (modelHandle == 0) {
    // 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
}
// 0,0,0,0 表示绑定窗口整个客户区
long textPtr = OcrEx(instance, 0, 0, 0, 0, modelHandle);
if (textPtr != 0) {
    char text[512] = {0};
    GetStringFromPtr(textPtr, text, sizeof(text));
    FreeStringPtr(textPtr);
}
csharp
using System.Runtime.InteropServices;
using System.Text;

[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern int GetStringFromPtr(long ptr, StringBuilder lpString, int size);
[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern int FreeStringPtr(long ptr);
[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern int GetStringSize(long ptr);
[DllImport("OLAPlug_x64.dll", CallingConvention = CallingConvention.StdCall)]
static extern long CreateCOLAPlugInterFace();

long instance = CreateCOLAPlugInterFace();
// 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
long modelHandle = OcrLoadModel(instance, "models/ocr.olam", "your_password", 0);
if (modelHandle == 0)
{
    // 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
}
// 0,0,0,0 表示绑定窗口整个客户区
long textPtr = OcrEx(instance, 0, 0, 0, 0, modelHandle);
if (textPtr != 0) {
    StringBuilder text = new StringBuilder(GetStringSize(textPtr) + 1);
    GetStringFromPtr(textPtr, text, text.Capacity);
    FreeStringPtr(textPtr);
    string textStr = text.ToString();
}
python
from ctypes import CDLL, c_int, c_int64, create_string_buffer

ola = CDLL("OLAPlug_x64.dll")
ola.CreateCOLAPlugInterFace.restype = c_int64
instance = ola.CreateCOLAPlugInterFace()
# 加载 OCR 加密模型包;内置 mobile 模型可直接使用 modelHandle=0
modelHandle = OcrLoadModel(instance, "models/ocr.olam", "your_password", 0)
if modelHandle == 0:
    # 加载失败请检查路径与密码,或改用内置模型 modelHandle=0
    pass
# 0,0,0,0 表示绑定窗口整个客户区
textPtr = OcrEx(instance, 0, 0, 0, 0, modelHandle)
if textPtr:
    buf = create_string_buffer(512)
    ola.GetStringFromPtr(textPtr, buf, 512)
    ola.FreeStringPtr(textPtr)
    text = buf.value.decode("utf-8")

返回值

字符串指针,识别到的文本。须调用 FreeStringPtr 释放。

注意事项

  • 需先 BindWindow;区域坐标相对窗口客户区。
  • 字体特殊或背景复杂时,可配合图像预处理或字库识字。